package core;
import java.io.File;
import java.io.IOException;


import com.aliasi.util.Files;


public class Document {

	public File document;
	public Sentence[] sentenceList;
	
	public Document(File _document){
		document=_document;
	}
	
	public void extraiFrases() throws Exception{
		String text = Files.readFromFile(document,"ISO-8859-1");
		String[] sentenceVector = SegmentaFicheiroTreinoEmFrases(text);
		sentenceList = new Sentence[sentenceVector.length];
		for(int i=0; i<sentenceVector.length; i++){
			sentenceList[i] = new Sentence(sentenceVector[i]);
		}
		return;
	}
	


	public String[] SegmentaFicheiroTreinoEmFrases(String text) throws IOException{

		String text_backup = text.toString();

		//Construcao do vector com as diferentes frases
		String[] divisaoTexto = text.split("</");
		int contador = divisaoTexto.length-1;
		String[] sentencesFile= new String[contador];


		//Preenchimento de cada posicao do vector
		for(int i=0; i<contador; i++){
			int inicioTagFecho = text.indexOf("</");
			text = text.substring(inicioTagFecho);
			int fimTagFecho = text.indexOf(">")+1;
			text = text.substring(fimTagFecho);
			String sentence = text_backup.substring(0, inicioTagFecho+fimTagFecho);
			sentencesFile[i] = sentence.trim();
			text_backup = text.toString();
		}		
		return sentencesFile;
	}

}